Serveur d'exploration sur la musique en Sarre

Attention, ce site est en cours de développement !
Attention, site généré par des moyens informatiques à partir de corpus bruts.
Les informations ne sont donc pas validées.

The MATE workbench – An annotation tool for XML coded speech corpora

Identifieur interne : 000C96 ( Main/Exploration ); précédent : 000C95; suivant : 000C97

The MATE workbench – An annotation tool for XML coded speech corpora

Auteurs : David Mckelvie [Royaume-Uni] ; Amy Isard [Royaume-Uni] ; Andreas Mengel [Allemagne] ; Morten Baun M Ller [Danemark] ; Michael Grosse [Danemark] ; Marion Klein [Allemagne]

Source :

RBID : ISTEX:EEC7BEC39C30E248E3F1CB6C672727CA35F39CFC

English descriptors

Abstract

This paper describes the design and implementation of the MATE workbench, a program which provides support for the annotation of speech and text. It provides facilities for flexible display and editing of such annotations, and complex querying of a resulting corpus. The workbench offers a more flexible approach than most existing annotation tools, which were often designed with a specific annotation scheme in mind. Any annotation scheme can be used with the MATE workbench, provided it is coded using XML markup (linked to the speech signal, if available, using certain conventions). The workbench uses a transformation language to define specialised editors optimised for particular annotation tasks, with suitable display formats and allowable editing operations tailored to the task. The workbench is written in Java, which means that it is platform-independent. This paper outlines the design of the workbench software and compares it with other annotation programs.
Zusammenfassung: Dieser Beitrag beschreibt das Design und die Implementierung der MATE Workbench, einem Programm für die Annotation von gesprochener und geschriebener Sprache. Die Workbench bietet Funktionen für die flexible Darstellung und Bearbeitung von Annotationen sowie komplexe Suchanfragen an vorhandene Korpora. Die Workbench hat einen offeneren Ansatz als die meisten existierenden Annotations-Werkzeuge, welche oft auf ein festes Annotationsschema zugeschnitten sind. In der MATE Workbench kann jedes Annotationsschema benutzt werden, so es in XML kodiert und – wenn verfügbar – mit einem Sprachsignal verbunden ist. Die Workbench nutzt eine Transformationssprache für die Definition und Generierung des für die jeweilige Aufgabe angemessenen Editors mit entsprechenden Anzeigeformaten und Bearbeitungsfunktionen. Die Workbench ist in der Programmiersprache Java geschrieben und somit platform-unabhängig. Der Beitrag erläutert das Design der Workbench-Software und vergleicht es mit dem anderer Annotationsprogramme.
Résumé: Nous présentons, dans cet article, la conception et le développement du workbench MATE, un programme pour l'annotation de la parole et des textes écrits. Il facilite la visualisation et l'édition flexibles de telles annotations, et permet des requêtes complexes sur un corpus résultant. Le workbench offre une approche plus souple que la plupart des outils d'annotation, qui ont souvent été conçus pour un jeu d'étiquettes spécifique. Le workbench MATE permet le traitement de tout jeu d'étiquettes pourvu que ce dernier puisse s'exprimer en format XML (rattaché au signal vocal, si disponible, en utilisant certaines conventions). Le workbench utilise un langage de transformation pour définir les éditeurs spécialisés qui sont optimalisés pour des tâches d'annotation particulières avec des visualisations appropriées et des actions permises conçues en fonction de la tâche. Le workbench est écrit dans le langage Java, ce qui le permet d'être indépendant de la plateforme. Cet article décrit l'architecture du logiciel du workbench et le compare à d'autres outils d'annotation.

Url:
DOI: 10.1016/S0167-6393(00)00071-6


Affiliations:


Links toward previous steps (curation, corpus...)


Le document en format XML

<record>
<TEI wicri:istexFullTextTei="biblStruct">
<teiHeader>
<fileDesc>
<titleStmt>
<title>The MATE workbench – An annotation tool for XML coded speech corpora</title>
<author>
<name sortKey="Mckelvie, David" sort="Mckelvie, David" uniqKey="Mckelvie D" first="David" last="Mckelvie">David Mckelvie</name>
</author>
<author>
<name sortKey="Isard, Amy" sort="Isard, Amy" uniqKey="Isard A" first="Amy" last="Isard">Amy Isard</name>
</author>
<author>
<name sortKey="Mengel, Andreas" sort="Mengel, Andreas" uniqKey="Mengel A" first="Andreas" last="Mengel">Andreas Mengel</name>
</author>
<author>
<name sortKey="Baun M Ller, Morten" sort="Baun M Ller, Morten" uniqKey="Baun M Ller M" first="Morten" last="Baun M Ller">Morten Baun M Ller</name>
</author>
<author>
<name sortKey="Grosse, Michael" sort="Grosse, Michael" uniqKey="Grosse M" first="Michael" last="Grosse">Michael Grosse</name>
</author>
<author>
<name sortKey="Klein, Marion" sort="Klein, Marion" uniqKey="Klein M" first="Marion" last="Klein">Marion Klein</name>
</author>
</titleStmt>
<publicationStmt>
<idno type="wicri:source">ISTEX</idno>
<idno type="RBID">ISTEX:EEC7BEC39C30E248E3F1CB6C672727CA35F39CFC</idno>
<date when="2001" year="2001">2001</date>
<idno type="doi">10.1016/S0167-6393(00)00071-6</idno>
<idno type="url">https://api.istex.fr/document/EEC7BEC39C30E248E3F1CB6C672727CA35F39CFC/fulltext/pdf</idno>
<idno type="wicri:Area/Istex/Corpus">001897</idno>
<idno type="wicri:explorRef" wicri:stream="Istex" wicri:step="Corpus" wicri:corpus="ISTEX">001897</idno>
<idno type="wicri:Area/Istex/Curation">001782</idno>
<idno type="wicri:Area/Istex/Checkpoint">000A87</idno>
<idno type="wicri:explorRef" wicri:stream="Istex" wicri:step="Checkpoint">000A87</idno>
<idno type="wicri:doubleKey">0167-6393:2001:Mckelvie D:the:mate:workbench</idno>
<idno type="wicri:Area/Main/Merge">000C97</idno>
<idno type="wicri:Area/Main/Curation">000C96</idno>
<idno type="wicri:Area/Main/Exploration">000C96</idno>
</publicationStmt>
<sourceDesc>
<biblStruct>
<analytic>
<title level="a">The MATE workbench – An annotation tool for XML coded speech corpora</title>
<author>
<name sortKey="Mckelvie, David" sort="Mckelvie, David" uniqKey="Mckelvie D" first="David" last="Mckelvie">David Mckelvie</name>
<affiliation wicri:level="4">
<country xml:lang="fr">Royaume-Uni</country>
<wicri:regionArea>Language Technology Group, University of Edinburgh, 2 Buccleuch Place, Edinburgh EH8 9LW</wicri:regionArea>
<orgName type="university">Université d'Édimbourg</orgName>
<placeName>
<settlement type="city">Édimbourg</settlement>
<region type="country">Écosse</region>
</placeName>
</affiliation>
<affiliation></affiliation>
<affiliation wicri:level="1">
<country wicri:rule="url">Royaume-Uni</country>
</affiliation>
</author>
<author>
<name sortKey="Isard, Amy" sort="Isard, Amy" uniqKey="Isard A" first="Amy" last="Isard">Amy Isard</name>
<affiliation wicri:level="4">
<country xml:lang="fr">Royaume-Uni</country>
<wicri:regionArea>Language Technology Group, University of Edinburgh, 2 Buccleuch Place, Edinburgh EH8 9LW</wicri:regionArea>
<orgName type="university">Université d'Édimbourg</orgName>
<placeName>
<settlement type="city">Édimbourg</settlement>
<region type="country">Écosse</region>
</placeName>
</affiliation>
</author>
<author>
<name sortKey="Mengel, Andreas" sort="Mengel, Andreas" uniqKey="Mengel A" first="Andreas" last="Mengel">Andreas Mengel</name>
<affiliation wicri:level="1">
<country xml:lang="fr">Allemagne</country>
<wicri:regionArea>Institut für Maschinelle Sprachverarbeitung, Universität Stuttgart</wicri:regionArea>
<wicri:noRegion>Universität Stuttgart</wicri:noRegion>
<wicri:noRegion>Universität Stuttgart</wicri:noRegion>
</affiliation>
</author>
<author>
<name sortKey="Baun M Ller, Morten" sort="Baun M Ller, Morten" uniqKey="Baun M Ller M" first="Morten" last="Baun M Ller">Morten Baun M Ller</name>
<affiliation wicri:level="1">
<country xml:lang="fr">Danemark</country>
<wicri:regionArea>Natural Interactive Systems Laboratory, Odense University</wicri:regionArea>
<wicri:noRegion>Odense University</wicri:noRegion>
</affiliation>
</author>
<author>
<name sortKey="Grosse, Michael" sort="Grosse, Michael" uniqKey="Grosse M" first="Michael" last="Grosse">Michael Grosse</name>
<affiliation wicri:level="1">
<country xml:lang="fr">Danemark</country>
<wicri:regionArea>Natural Interactive Systems Laboratory, Odense University</wicri:regionArea>
<wicri:noRegion>Odense University</wicri:noRegion>
</affiliation>
</author>
<author>
<name sortKey="Klein, Marion" sort="Klein, Marion" uniqKey="Klein M" first="Marion" last="Klein">Marion Klein</name>
<affiliation wicri:level="3">
<country xml:lang="fr">Allemagne</country>
<wicri:regionArea>Deutsches Forschungszentrum für Künstliche Intelligenz, Saarbrücken</wicri:regionArea>
<placeName>
<region type="land" nuts="2">Sarre (Land)</region>
<settlement type="city">Sarrebruck</settlement>
</placeName>
</affiliation>
</author>
</analytic>
<monogr></monogr>
<series>
<title level="j">Speech Communication</title>
<title level="j" type="abbrev">SPECOM</title>
<idno type="ISSN">0167-6393</idno>
<imprint>
<publisher>ELSEVIER</publisher>
<date type="published" when="2001">2001</date>
<biblScope unit="volume">33</biblScope>
<biblScope unit="issue">1–2</biblScope>
<biblScope unit="page" from="97">97</biblScope>
<biblScope unit="page" to="112">112</biblScope>
</imprint>
<idno type="ISSN">0167-6393</idno>
</series>
</biblStruct>
</sourceDesc>
<seriesStmt>
<idno type="ISSN">0167-6393</idno>
</seriesStmt>
</fileDesc>
<profileDesc>
<textClass>
<keywords scheme="Teeft" xml:lang="en">
<term>Abstract data model</term>
<term>Annotation</term>
<term>Annotation scheme</term>
<term>Annotation schemes</term>
<term>Annotation tool</term>
<term>Annotation tools</term>
<term>Chooser menu</term>
<term>Common framework</term>
<term>Communication problem</term>
<term>Computational linguistics</term>
<term>Consortium</term>
<term>Corpus</term>
<term>Corpus annotations</term>
<term>Corpus descriptions</term>
<term>Corpus encoding</term>
<term>Data model</term>
<term>Database</term>
<term>Dialogue move</term>
<term>Display object</term>
<term>Display object types</term>
<term>Display objects</term>
<term>Display processor</term>
<term>Display structure</term>
<term>Display structures</term>
<term>Document structure</term>
<term>Dummy elements</term>
<term>Edinburgh speech tools library</term>
<term>Editing actions</term>
<term>Element names</term>
<term>Elsevier science</term>
<term>Example interfaces</term>
<term>Exible</term>
<term>Exible display</term>
<term>Future work</term>
<term>Hcontrastivei element</term>
<term>Hierarchical structure</term>
<term>Href</term>
<term>Href attributes</term>
<term>Hyperlink</term>
<term>Input document</term>
<term>Interface</term>
<term>Internal database</term>
<term>Internal representation</term>
<term>Java</term>
<term>Java classes</term>
<term>Linguistic annotation</term>
<term>Linguistic annotations</term>
<term>Lore project</term>
<term>Many sound formats</term>
<term>Mate display objects</term>
<term>Mate interface</term>
<term>Mate project</term>
<term>Mate query language</term>
<term>Mate stylesheets</term>
<term>Mate workbench</term>
<term>Mckelvie</term>
<term>Mengel</term>
<term>Node</term>
<term>Other elements</term>
<term>Other nodes</term>
<term>Particular annotation tasks</term>
<term>Particular aspects</term>
<term>Partitur format</term>
<term>Phonetic sciences</term>
<term>Programming language</term>
<term>Query</term>
<term>Query language</term>
<term>Query languages</term>
<term>Query languages workshop</term>
<term>Query results</term>
<term>Relational models</term>
<term>Right pane</term>
<term>Same document</term>
<term>Same format</term>
<term>Same segment</term>
<term>Schema language</term>
<term>Semistructured data</term>
<term>Software</term>
<term>Specialised</term>
<term>Specialised software</term>
<term>Speech communication</term>
<term>Speech corpora</term>
<term>Speech signal</term>
<term>Speech signals</term>
<term>Startup window</term>
<term>Stylesheet</term>
<term>Stylesheet language</term>
<term>Stylesheet processor</term>
<term>Stylesheets</term>
<term>Task corpus</term>
<term>Text encoding initiative</term>
<term>Textual inclusion</term>
<term>Transformation language</term>
<term>Transformation languages</term>
<term>Tree structure</term>
<term>User</term>
<term>User actions</term>
<term>User interface</term>
<term>Workbench</term>
<term>Xslt</term>
</keywords>
</textClass>
<langUsage>
<language ident="en">en</language>
</langUsage>
</profileDesc>
</teiHeader>
<front>
<div type="abstract" xml:lang="en">This paper describes the design and implementation of the MATE workbench, a program which provides support for the annotation of speech and text. It provides facilities for flexible display and editing of such annotations, and complex querying of a resulting corpus. The workbench offers a more flexible approach than most existing annotation tools, which were often designed with a specific annotation scheme in mind. Any annotation scheme can be used with the MATE workbench, provided it is coded using XML markup (linked to the speech signal, if available, using certain conventions). The workbench uses a transformation language to define specialised editors optimised for particular annotation tasks, with suitable display formats and allowable editing operations tailored to the task. The workbench is written in Java, which means that it is platform-independent. This paper outlines the design of the workbench software and compares it with other annotation programs.</div>
<div type="abstract" xml:lang="de">Zusammenfassung: Dieser Beitrag beschreibt das Design und die Implementierung der MATE Workbench, einem Programm für die Annotation von gesprochener und geschriebener Sprache. Die Workbench bietet Funktionen für die flexible Darstellung und Bearbeitung von Annotationen sowie komplexe Suchanfragen an vorhandene Korpora. Die Workbench hat einen offeneren Ansatz als die meisten existierenden Annotations-Werkzeuge, welche oft auf ein festes Annotationsschema zugeschnitten sind. In der MATE Workbench kann jedes Annotationsschema benutzt werden, so es in XML kodiert und – wenn verfügbar – mit einem Sprachsignal verbunden ist. Die Workbench nutzt eine Transformationssprache für die Definition und Generierung des für die jeweilige Aufgabe angemessenen Editors mit entsprechenden Anzeigeformaten und Bearbeitungsfunktionen. Die Workbench ist in der Programmiersprache Java geschrieben und somit platform-unabhängig. Der Beitrag erläutert das Design der Workbench-Software und vergleicht es mit dem anderer Annotationsprogramme.</div>
<div type="abstract" xml:lang="fr">Résumé: Nous présentons, dans cet article, la conception et le développement du workbench MATE, un programme pour l'annotation de la parole et des textes écrits. Il facilite la visualisation et l'édition flexibles de telles annotations, et permet des requêtes complexes sur un corpus résultant. Le workbench offre une approche plus souple que la plupart des outils d'annotation, qui ont souvent été conçus pour un jeu d'étiquettes spécifique. Le workbench MATE permet le traitement de tout jeu d'étiquettes pourvu que ce dernier puisse s'exprimer en format XML (rattaché au signal vocal, si disponible, en utilisant certaines conventions). Le workbench utilise un langage de transformation pour définir les éditeurs spécialisés qui sont optimalisés pour des tâches d'annotation particulières avec des visualisations appropriées et des actions permises conçues en fonction de la tâche. Le workbench est écrit dans le langage Java, ce qui le permet d'être indépendant de la plateforme. Cet article décrit l'architecture du logiciel du workbench et le compare à d'autres outils d'annotation.</div>
</front>
</TEI>
<affiliations>
<list>
<country>
<li>Allemagne</li>
<li>Danemark</li>
<li>Royaume-Uni</li>
</country>
<region>
<li>Sarre (Land)</li>
<li>Écosse</li>
</region>
<settlement>
<li>Sarrebruck</li>
<li>Édimbourg</li>
</settlement>
<orgName>
<li>Université d'Édimbourg</li>
</orgName>
</list>
<tree>
<country name="Royaume-Uni">
<region name="Écosse">
<name sortKey="Mckelvie, David" sort="Mckelvie, David" uniqKey="Mckelvie D" first="David" last="Mckelvie">David Mckelvie</name>
</region>
<name sortKey="Isard, Amy" sort="Isard, Amy" uniqKey="Isard A" first="Amy" last="Isard">Amy Isard</name>
<name sortKey="Mckelvie, David" sort="Mckelvie, David" uniqKey="Mckelvie D" first="David" last="Mckelvie">David Mckelvie</name>
</country>
<country name="Allemagne">
<noRegion>
<name sortKey="Mengel, Andreas" sort="Mengel, Andreas" uniqKey="Mengel A" first="Andreas" last="Mengel">Andreas Mengel</name>
</noRegion>
<name sortKey="Klein, Marion" sort="Klein, Marion" uniqKey="Klein M" first="Marion" last="Klein">Marion Klein</name>
</country>
<country name="Danemark">
<noRegion>
<name sortKey="Baun M Ller, Morten" sort="Baun M Ller, Morten" uniqKey="Baun M Ller M" first="Morten" last="Baun M Ller">Morten Baun M Ller</name>
</noRegion>
<name sortKey="Grosse, Michael" sort="Grosse, Michael" uniqKey="Grosse M" first="Michael" last="Grosse">Michael Grosse</name>
</country>
</tree>
</affiliations>
</record>

Pour manipuler ce document sous Unix (Dilib)

EXPLOR_STEP=$WICRI_ROOT/Wicri/Sarre/explor/MusicSarreV3/Data/Main/Exploration
HfdSelect -h $EXPLOR_STEP/biblio.hfd -nk 000C96 | SxmlIndent | more

Ou

HfdSelect -h $EXPLOR_AREA/Data/Main/Exploration/biblio.hfd -nk 000C96 | SxmlIndent | more

Pour mettre un lien sur cette page dans le réseau Wicri

{{Explor lien
   |wiki=    Wicri/Sarre
   |area=    MusicSarreV3
   |flux=    Main
   |étape=   Exploration
   |type=    RBID
   |clé=     ISTEX:EEC7BEC39C30E248E3F1CB6C672727CA35F39CFC
   |texte=   The MATE workbench – An annotation tool for XML coded speech corpora
}}

Wicri

This area was generated with Dilib version V0.6.33.
Data generation: Sun Jul 15 18:16:09 2018. Site generation: Tue Mar 5 19:21:25 2024